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Abstractor DE41 06405 

The noise suppression device lias an audio 
device coupled to a loudspeaker (2) contained 
in the same room as the microphone (1 ) for 
the speech signals. Two signal extraction 
stages remove data from the signals fed to the 
loudspeaker (2) and provided by the 
microphone (1). The two signal extraction 
stages (10,20) are coupled directly and via a 
multiplier (27) with a controlled transfer 
function to a noise subtraction stage (30). The 
microphone (1) is housed in vehicle together 
with the loudspeaker (2), the transfer function 
being adjusted for the number of people in the 
vehicle. USE/ADVANTAGE - E.g. for voice- 
operated features of car telephone, or for voice 
control of vehicle functions. For reliable 
speech recognition in noisy environment. 




:: 



I 

! 

I 









TT ■ 

s .| ; 




*t 1 















5 it> 

I- J ■! 



1 



-A •» w 



40^ 



' „:,',x: 





] 



L 



^nwvvwvvvvvvvvvwwi 



■ ■ n i iiTii :::::::::.: . -.v. 



Mm iiiiiiiiiiiiiii i ih 



Data supplied from the esp@cenet database - Worldwide 



http ://v3 .espacenet.com/textdoc?DB=EPODOC&IDX=DE4 1 06405&F=0 



2007-07-31 



(ID BUNDESREPUBLiK ® Of f Giileg unQsschrif t 

DE 4106405 A1 



dj) Int. CI.S: 



DEUTSCHLAND 




G 10 L 3/00 



DEUTSCHES 



@ Aktenzeichen: 
(2) Anmeldetag: 
(§) Offenlegungstag: 



P 41 06 405.4 
28. 2.91 
26. 9.91 



PATENTAMT 



® Unionsprioritat: ® (S) ® 

23.03.90 JP 2-74689 23.03.90 JP 2-74690 

@ Anmelder: 

Ricoh Co., Ltd., Tokio/Tokyo, JP 

@ Vertreter: 

Schwabe, H., DipL-Ing,; Sandmair, K., Dipl.-Chem. 
Dr.jur. Dr.rer.nat.; Marx, L, Dipl.-Phys. Dr.rer.nat, 
Pat.-Anwalte, 8000 Munchen 



@ Erfinder: 

Ariyoshi, Takashi; Fujimoto, Junichiroh, Yokohama, 
Kanagawa, JP 



Prufungsantrag gem. § 44 PatG 1st gestellt 

@ Gerauschunterdruckungseinrichtung 

@ Eine Gerauschunterdruckungseinrichtung wird in einem 
Spracherkennungssystem verwendet, in welchem eine Spra- 
che/Stimme eines Sprechers, welche einem Mikrophon (1) 
zugefuhrt worden ist erkannt werden kann, wobei das 
Mikrophon (1) in einem Raum mit einem Lautsprecher (2) ist, 
der einen Klang abgibt, welcher einem wiederzugebenden 
Signal entspricht, welches von einer Audio-Einheit dem 
Lautsprecher (2) zugefuhrt worden ist. Die Gerauschunter- 
druckungseinrichtung weist eine erste Kennzeichen-Extra- 
hiereinheit (10), um erste Kennzeichendaten von einem 
akustischen Signal zu extrahieren, das von dem Mikrophon 
(1) abgegeben worden ist, eine zweite Kennzeichen-Extra- 
hiereinheit (20), um zweite Kennzeichendaten aus dem zu 
ubertragenden Signal zu extrahieren, welches dem Laut- 
sprecher (2) zugefuhrt werden sollte, einen Speicher (28) 
zum Speichern einer Transferfunktion, eine Multiplizierein- 
^ heit (27), um die zweiten Kennzeichendaten und die Obertra- 
gungsfunktion miteinander zu multlplizieren und Gerausch- 
IX> daten abzugeben, und eine erste Gerausche-Subtrahierein- 
O heit (30) auf, um die Gerauschdaten von den ersten 
^ Kennzeichendaten zu subtrahieren, um erste Sprachdaten 
CO abzugeben. Die ersten Sprachdaten werden dazu verwen- 
O det, die Sprache/Stimme des Sprechers zu erkennen. 
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Die Erfindung betrifft einen Gerauschunterdriik- 
kungseinrichtung in einem Spracherkennungssystem 
nach dem Oberbegriff des Anspruchs 1 oder 11, und 
betrifft insbesondere eine Gerauschunterdruckungsein- 
richtung in einem Spracherkennungssystem, in welchem 
ein Gerausch unterdruckt werden kann, das von einer 
Audioeinheit, wie einem Stereo-Radiogerat oder einem 
Stereo-Bandrecorder erzeugt worden ist. 

Ein Spracherkennungssystem mit einer Gerauschun- 
terdruckungseinrichtung gemaB der Erfindung wird bei- 
spielsweise in einem Fahrzeug verwendet. Diese Art 
Spracherkennungssystem wird beim Wahlen eines in 
dem Fahrzeug vorgesehenen Telephons und zum Steu- 
ern verschiedener Einheiten, wie Audio-Einheiten, Luft- 
Conditioner oder Klima-Anlagen sowie Navigationssy- 
stemen verwendet, welche im Fahrzeug vorgesehen 
sind. Das vorerwahnte Spracherkennungssystem kann 
auch in einem Haus, in einem Buro u, a. verwendet wer- 
den. 

Vor kurzem ist auch das Eingeben von Informationen 
in eine Maschine mit Hilfe der Sprache gemeldet wor- 
den. Das heiBt, es ist ein Spracherkennungssystem vor- 
geschlagen worden, welches bei einer Steuereinheit ver- 
wendet werden kann, urn eine AudioEinheit, einen Luft- 
Conditioner bzw. eine Klimaanlage, ein Navigationssy- 
stem u. a. zu steuern, welche in einem Fahrzeug vorge- 
sehen sind. In dem Fahrzeug beeinflussen verschiedene 
Arten von Gerauschen im Fahrzeuginneren das Sprach- 
erkennungssystem, wenn das Fahrzeug fahrt, und Klan- 
ge von in dem Fahrzeug vorgesehenen Audio-Einheiten 
wirken auf das Spracherkennungssystem, wie Ge- 
rausche im Fahrzeuginneren. Folglich muB in dem im 
Fahrzeug vorgesehenen Spracherkennungssystem eine 
Gerauschunterdruckungseinrichtung vorgesehen wer- 
den, um die verschiedenen Arten von Gerauschen im 
Fahrzeuginneren zu unterdriicken. 

Beispiele von herkommlicher Spracherkennung sind 
die "Spektrale Subtrakibnsmethode von S.F.BoH u.a.** 
und eine "Adaptive Gerauschunterdnickungsmethode 
von B.Window u. a.**. 

In der "spektraien Subtraktionsmethode" wird ein 
Spektrum des GerSusches unter einer Bedingung abge- 
tastet, bei welcher keine Sprache vorhanden ist, welche 
erkannt werden sollte, und dann wird das abgetastete 
Spektrum des Gerausches in einer Speichereinheit ge- 
speichert. Das abgetastete Spektrum des Gerausches in 
der Speichereinheit wird fortlaufend aktuaiisiert. Wenn 
die Stimme eines Sprechers mit einem Mikrophon unter 
der Voraussetzung aufgenommen wird, daB es Verschie- 
dene Arten von Gerauschen gibt, wird das Spektrum 
des in der Speichereinheit gespeicherten Gerausches 
von einem akustischen Spektrum subtrahiert, welches 
einem akustischen Signal entspricht, das iiber das Mi- 
krophon erhalten worden ist, so daB nur eine Stimmen- 
spektrumskomponente, welche der Stimme des Spre- 
chers entspricht, erhalten wird. 

In der vorerwahnten "spektraien Subtraktionsmetho- 
de" kdnnen, da das Gerauschspektrum laufend aktuaii- 
siert wird, Hintergrundgerausche von dem akustischen 
Signal subtrahiert werden. Es ist jedoch schwierig, ein 
unregelmaBiges Gerausch, welches bezuglich der Zeit in 
unregelmaBiger Weise erzeugt wird, von dem akusti- 
schen Signal zu subtrahieren. Das unregelmaBige Ge- 
rausch enthalt den Klang, welcher von der Audio- Ein- 
heit, wie einem Radiogerat und einem Stereo-Bandrec- 
order abgegeben worden ist. 



Bei der "adaptiven Gerauschunterdruckungsmetho- 
de", bei welcher beispielsweise zwei Mikrophone ver- 
wendet werden, ist ein erstes Mikrophon nahe bei dem 
Sprecher und ein zweites Mikrophon weit von dem 
5 Sprecher entfernt vorgesehen. Die Stimme des Spre- 
chers wird hauptsachlich von dem ersten Mikrophon 
aufgenommen. Verschiedene Arten von Gerauschen ge- 
langen in die beiden Mikrophone bzw. werden von die- 
sen aufgenommen. In diesem Fall wird ein Gerauschsi- 
10 gnal, welches uber das zweite Mikrophon erhalten wor- 
den ist, in einem adaptiven Filter verarbeitet, in wel- 
chem dessen Fihercharakteristik gesteuert werden 
kann. Das von dem adaptiven Filter abgegebene Signal 
wird von dem akustischen Signal subtrahiert, welches 
15 iiber das erste Mikrphon erhalten worden ist, so daB ein 
Stimmensignal, welches der Stimme des Sprechers ent- 
spricht, erhalten wird. Die Fihercharakteristik des vor- 
erwahnten adaptiven Filters wird so gesteuert, daB der 
Fehler (e) eines Ausgangssignals minimiert wird. 
20 Bei der vorstehend erwahnten ''adaptiven Ger^usch- 
unterdriickungsmethode** mit zwei Mikrophonen ist ein 
Computer fQr eine aufwendige Berechnung erforder- 
lich, um die Fihercharakteristik des adaptiven Filters zu 
steuern. Daher werden die Kosten der Gerauschunter- 
25 druckungseinrichtung hoher. In einem Fall, bei welchem 
das Gerausch, welches beachtet werden sollte, auf den 
Klang von der Audio-Einheit beschrankt wird, ist die 
Gerauschunterdruckungseinrichtung, die nach der vor- 
erwahnten ''adaptiven Gerauschunterdrtickungsmetho- 
30 de" arbeitet, fur den praktischen Gebrauch nicht gut. 
AuBerdem ist es dann, wenn eine Vielzahl von Ge- 
rauschen zusammentrifft, schwierig, die Fihercharakte- 
ristik des vorerwahnten adaptiven Filters zu steuern, so 
daB keine richtige Rauschunterdruckung durchgefuhrt 
35 werden kann. 

GemaB der Erfindung soil daher eine Gerauschunter- 
druckungseinrichtung fur ein Spracherkennungssystem 
geschaffen werden, bei welchem die Nachteile des Stan- 
des der Technik ausgeschaltet sind Ferner soil gemaB 
40 der Erfindung eine Gerauschunterdruckungseinrich- 
tung geschaffen werden, in welcher ein Gerausch leicht 
aus dem akustischen Signal entfernt werden kann, selbst 
wenn der Klang der Audio-Einheit dem akustischen Si- 
gnal als das Gerausch uberlagert ist. GemaB der Erfin- 
45 dung ist dies bei einer Gerauschunterdruckungseinrich- 
tung nach dem Oberbegriff des Anspruchs 1 oder 11 
durch die Merkmale im kennzeichnenden Teil des je- 
weiligen Anspruchs erreicht Vorteilhafte Weiterbildun- 
gen sind Gegenstand der auf einen der Anspruche mit- 
50 telbar oder unmittelbar ruckbezogenen Unteranspru- 
che. 

Nachfolgend wird die Erfindung anhand von bevor- 
zugten Ausfiihrungsformen unter Bezugnahme auf die 
anliegenden Zeichnungen im einzelnen erlautert. Es zei- 
55 gen 

Fig. 1 ein Blockdiagramm eines Spracherkennungssy- 
stems mit einer Gerauschunterdrtickungseinrichtung 
gemaB einer ersten Ausfuhrungsform der Erfindung; 
Fig. 2 ein Blockdiagramm einer Modifikation des in 
60 Fig. 1 dargestellten Spracherkennungssystems; 

Fig. 3 ein Blockdiagramm eines Spracherkennungssy- 
stems mit einer Gerauschunterdruckungseinrichtung 
gemaB einer zweiten Ausfuhrungsform der Erfindung; 
Fig. 4 ein Blockdiagramm einer Modifikation des in 
65 Fig. 3 dargestellten Spracherkennungssystems; 

Fig. 5 ein Diagramm, in welchem Detektoren zum 
Feststellen des Offnens und SchlieBens von Fahrzeugtu- 
ren dargestellt sind, und 
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Fig. 6 ein Diagramm eines Detektors, um festzustel- 
len, wie oft ein Fahrzeug-Fenster geoffnet wird. 

Nunmehr wird eine erste Ausfuhrungsform der Erfin- 
dung anhand von Fig. 1 beschrieben. Das in Fig. 1 dar- 
gestellte Spracherkennungssystem ist beispielsweise in 5 
einem Fahrzeug vorgesehen. In Fig. 1 sind in dem Fahr- 
zeug ein Mikrophon 1 und ein Lautsprecher 2 vorgese- 
hen. Ein Radiogerat, ein Stereo-Gerat, u. a. welche in 
dem Fahrzeug vorgesehen sind, liefern wiederzugeben- 
de Signale an den Lautsprecher 2, und der Lautsprecher 10 
2 setzt die wiederzugebenden Signale in Klange um. Die 
Stimme eines Sprechers, die Klange aus dem Lautspre- 
cher 2 und verschiedene Gerausche im Fahrzeuginne- 
ren werden von dem Mikrophon 1 aufgenommen. Ein 
erste Kennzeichen-Extrahiereinheit 10 holt Kennzel- 15 
Chen Oder Merkmale aus dem akustischen Signal heraus, 
welche Gerausche enthalten, wobei die akustischen Si- 
gnale von dem Mikrophon 1 aus der ersten Kennzei- 
chen-Extrahiereinheit 10 zugefuhrt werden. Eine zweite 
Kennzeichen-Extrahiereinheit 20 hoh Merkmale oder 20 
Kennzeichen aus wiederzugebenden Signaien heraus, 
welche von jeder Audio-Einheit, wie dem RadiogerSt 
und dem Stereo-Gerat geliefert worden sind Eine erste 
Gerausche-Subtrahiereinheit 30 subtrahiert GerSusch- 
daten, welche von der zweiten Kennzeichen- Ex trahier- 25 
einheit 20 erhalten worden sind, von Audio-Daten, wel- 
che von der ersten Kennzeichen-Extrahiereinheit 10 er- 
halten worden sind Eine Sprachintervall-Detektions- 
einheit 40 stellt Sprachintervalle, welche Intervalle fur 
Sprachen oder Stimmen sind, in einer Datenreihe fest, 30 
welche von der ersten Gerausche-Subtrahiereinheit 30 
zugefuhrt worden sind Eine Gerausche- Vermutungs- 
einheit 50 vermutet Nicht-Sprachen- Intervalle, welche 
Intervalle auQer dem Sprachintervall sind, in der Daten- 
reihe, welche von der ersten Gerausche-Subtrahierein- 35 
heit 30 geliefert werden. Eine zweite Gerausche-Subtra- 
hiereinheit 60 subtrahiert die Gerauschkomponente, 
welche durch die Vermutungsoperation in der Ge- 
rausche- Vermutungseinheit 50 erhalten worden sind, 
von den Daten in den Sprachintervallen, welche durch 40 
die Sprachintervall-Detektionseinheit 40 festgestellt 
worden sind. Eine Eingangsmuster erzeugende Einheit 
70 erzeugt ein eingegebenes Sprachmuster der Stimme 
des Sprechers auf der Basis der Daten, welche von der 
zweiten Gerausche-Subtrahiereinheit 60 abgegeben 45 
worden sind Eine Erkennungseinheit 90 vergleicht ver- 
schiedene Referenzmuster, welche in einem Referenz- 
musterspeicher 80 gespeichert sind und das eingegebe- 
ne Sprachmuster, das von der eingegebene Muster ver- 
gleichenden Einheit 70 erzeugt worden ist, und gibt ein 50 
Erkennungsergebnis ab, welches durch den vorstehen- 
den Vergleich erhalten wird 

Nunmehr wird das in Fig. 1 dargestellte Spracherken- 
nungssystem im einzelnen beschrieben. Die erste Kenn- 
zeichen-Extrahiereinheit 10, welche die Merkmale oder 55 
Kennzeichen aus dem von dem Mikrophon zugefiihrten, 
akustischen Signal extrahiert, weist einen Verstarker 11, 
eine Vorverzerrungsschaltung 12, eine BandpaB-Filter- 
bank 13, einen Multiplexer 14 und einen A/D-Umsetzer 
15 auf. Der Verstarker 11 hat eine vorherbestimmte eo 
Verstarkung und verstarkt das akustische, von dem Mi- 
krophon 1 zugefuhrte Signal. Die Vorverzerrerschal- 
tung 12 hebt Frequenzkomponenten in dem Hochfre- 
quenzband des von dem Verstarker 11 zugefuhrten. 
akustischen Signals an. Die BandpaB-Filterbank 13 hat 65 
funfzehn BandpaB-Filter. Die verschiedenen Frequenz- 
bander der funfzehn BandpaB-Filter unterscheiden sich 
voneinander. Funfzehn Frequenzen, welche auf einer 



Achse von iogarithmischen Koordinaten, welche von 
250 Hz bis 6,5 Khz reichen, in regelmaBigen Intervallen 
angeordnet sind, sind Mittenfrequenzen der Frequenz- 
bander der funfzehn BandpaB-Filter. Die BandpaB-Fil- 
terbank 13 hat auch Gleichrichter und TiefpaBfilter, 
welche jeweils einem der Frequenzbander entsprechen. 
Mit Hilfe der BandpaB-Filter, der Gleichrichter und der 
TiefpaBfilter stellt die BandpaB-Filterbank 13 Spektren 
des von dem Mikrophon 1 aufgenommenen Klangs fest 
Der Multiplexer 14 wahit eines der Spektren in den 
funfzehn Frequenzbandern aus, wobei die Spektren von 
der BandpaB-Filterbank 13 zugefuhrt werden. Der A/D- 
Umsetzer 15 setzt ein Spektrum in jedem Frequenz- 
band mit einer Abtastfrequenz von 10 ms in digitale 
Daten um. Daher wird in der ersten Kennzeichen-Extra- 
hiereinheit 10 das Signal, welches den Verstarker 1 1, die 
Vorverzerrerschaltung 12, die BandpaB-Filterbank 13, 
den Multiplexer 14 und den A/D-Umsetzer 15 passiert 
hat, in ein zeitspektrales Muster X(t,f) umgesetzt, das 
Gerausche enthalt, wobei t eine Zeitkomponente und f 
eine Frequenzkomponente ist 

Die zweite Kennzeichen-Extrahiereinheit 20 extra- 
hiert die Merkmale aus dem wiederzugebenden Signal, 
welches durch den Lautsprecher 2 in den Klang umge- 
setzt werden sollte. Der Klang aus dem Lautsprecher 2 
wird als Gerausch dem Mikrophon 1 zugefuhrt Die 
zweite Kennzeichen-Extrahiereinheit 20 weist eine Vor- 
verzerrerschaltung 22, eine BandpaB-Filterbank 23, ei- 
nen Multiplexer 24 und einen A/D-Umsetzer 25 auf. Die 
Vorverzerrerschaltung 22 hebt die Frequenzkompo- 
nenten in dem hochfrequenten Band des wiederzuge- 
benden Signals an, das von den Audio-Einheiten zuge- 
fuhrt worden ist Die BandpaB-Filterbank 23 ermittelt 
Spektren des wiederzugebenden Signals in derselben 
Weise wie die BandpaB-Filterbank 13 der ersten Kenn- 
zeichen-Extrahiereinheit 10. Der Multiplexer 24 wahIt 
eines der von der BandpaB-Filterbank 23 gelieferten 
Spektren aus. Der A/D-Umsetzer 25 setzt ein Spektrum 
in jedem Frequenzband, wobei das Spektrum von dem 
Multiplexer 24 zugefOhrt wird, in digitale Daten um. In 
der zweiten Kennzeichen-Extrahiereinheit 20 wird das 
wiederzugebende Signal, welches die Vorverzerrer- 
schaltung 12, die BandpaB-Filterbank 23, den Multiple- 
xer 24 und den A/D-Umsetzer 25 passiert hat, in ein 
zeitspektrales Muster N(t,f) des wiederzugebenden Si- 
gnals umgesetzt, das dem Lautsprecher 2 zugefuhrt 
werden soil. 

Eine Obertragungsfunktion H(f) zwischen dem Laut- 
sprecher 2 und dem Mikrophon 1 ist vorher in einem 
Ubertragungsfunktions-Speicher 28 gespeichert wor- 
den. Die Obertragungsfunktion H(f) zeigt eine Voraus- 
setzung an, bei welcher der von dem Lautsprecher 2 
abgegebene Klang sich zu dem Mikrophon 1 hin aus- 
breitet. Das heiBt. die Obertragungsfunktion H(f) zeigt 
eine Beziehung zwischen einem von dem Lautsprecher 
2 abgegebenen Klang und einem an dem Mikrophon 1 
ankommenden Klang an und verandert sie auf der Basis 
eines Zustands des Raums, welcher den Lautsprecher 2 
und das Mikrophon 1 umgibt. Die Obertragungsfunk- 
tion H(f) kann experimentell erhalten werden, Wenn 
beispielsweise ein pulsformiges Signal durch den Laut- 
sprecher 2 in einen Klang umgewandelt wird, wird ein 
durch das Mikrophon 1 erhaltener Impuls-Frequenzbe- 
reich entsprechend einer Fourier-Transformation ver- 
arbeitet Hierdurch wird die Obertragungsfunktion H(f) 
zwischen dem Lautsprecher 2 und dem Mikrophon 1 
erhalten. Die Obertragungsfunktion H(f) zwischen dem 
Lautsprecher 2 und dem Mikrophon 1 kann auch auf der 
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Basis eines Frequenzbereichs des Mikrophons 1 erhal- 
ten werden, wenn der Lautsprecher 2 ein weiBes Rau- 
schen oder Signale mit einer Frequenzabtastung wie- 
dergibt. 

In einer Multipliziereinheit 27 wird das zeitspektrale 5 
Muster N(t,f) von dem A/D-Umsetzer 25 und die aus 
dem Speicher 28 gelesene Obertragungsfunktion H(f) 
eingegeben, und sie (27) berechnet eines erstes zeitspek- 
trales Gerauschmuster Ni(t,f) entsprechend der folgen- 
den Formel: 



10 



Ni(t,f) = N(t,f)xH(f). 



Das erste zeitspektrale Gerauschmuster Ni(t,f) ent- 
spricht einem zeitspektralen Muster eines Klangs, wel- 15 
cher von dem Mikrophon 1 aufgenommen wird, wenn 
der Lautsprecher 2 einen Klang mit dem zeitspektralen 
Muster N(t,f) abgibt. 

Die erste Gerausche-Subtrahiereinheit 30 erhait das 
von der ersten Kennzeichen-Extrahiereinheit 10 abge- 20 
gebene zeitspektrale Muster X(t,f) und das erste, von 
der zweiten Kennzeichen-Extrahiereinheit 20 abgege- 
bene, zeitspektrale Gerauschmuster Ni(t,f) und subtra- 
hiert das erste zeitspektrale Gerauschmuster Nt(t,f) von 
dem zeitspektralen Muster X(t,f). Daher erzeugt die er- 25 
ste Gerausche-Subtrahiereinheit 30 ein zeitspektrales 
Muster Xi(t,f) entsprechend der nachstehenden Formel 



Gerauschen und nicht dem von dem Lautsprecher 2 
abgegebenen Klang. Das heiBt, das zweite zeitspektrale 
Gerauschmuster N2(t,f) entspricht einem Motorger- 
ausch, einem StraBengerSusch u. a, welches hauptsach- 
lich regelmaBige Gerausche sind, in welchen sich uber 
einen entsprechenden Zeitabschnitt bezuglich der Zeit 
nicht viel andert. Die zweite Gerausche-Subtrahierein- 
heit 60 subtrahiert das zweite zeitspektrale Gerausch- 
muster N2(t,f) von den zeitspektralen Mustern Xis(t,f), 
welche von der ersten Gerausche-Subtrahiereinheit 30 
in mittels der Einheit 40 ermittelten Sprachintervalle 
abgegeben werden, so daB die zweite Gerausche-Sub- 
trahiereinheit 60 die folgenden zeitspektralen Muster 
S(t,f) abgibt, welche der Stimme des Sprechers entspre- 
chen sollen. 

S(t,f) = X,s(t,f) - N2(t,f). 



Xi(t,f) = X(t.f)-N,(t,f). 



30 



Wie vorstehend bereits beschrieben worden ist, ent- 
spricht das zeitspektrale Muster Xi(t,f) einem Signal, 
welches erhalten wird. indem das Gerausch, welches auf 
dem wiederzugebenden Signal basiert, welches durch 
den Lautsprecher 2 in den Klang umgewandelt werden 35 
soli, von dem akustischen Signal subtrahiert wird, das 
von dem Mikrophon 1 erhalten wird. Die Sprachinter- 
vall-Detektionseinheit 40 ermittelt die Sprachintervalle 
auf der Basis der zeitspektralen Muster Xi(t,f), welche 
von der ersten Gerausche-Subtrahiereinheit abgegeben 40 
worden sind. Die Sprachintervall-Detektionseinheit 40 
ermittelt die Sprachintervalle wie folgt 

In jedem Rahmen fur eine Abtastzeit (beispielsweise 
10 ms) werden die zeitspektralen Muster Xi(t,f) in alien 
(fiinfzehn) Frequenzbandern so addiert, daB die folgen- 45 
de Gesamtsumme erhalten wird: 



15 



i;x,(f,t) 



50 



Wenn die Gesamtsumme groBer als ein vorherbe- 
stimmter Schwellenwert ist, wird der Rahmen als das 
Sprachintervall festgelegt. 55 

Die Gerausche- Vermutungseinheit 50 nimmt fortlau- 
fend das Mittel der zeitspektralen Muster Xin(t,f), wel- 
che von der ersten Gerausche-Subtrahiereinheit 30 ab- 
gegeben werden, in Intervallen auBer dem Sprachinter- 
vall, das von der Sprachintervall- Detektionseinheit 40 eo 
ermittelt worden ist. In den vorstehend angefiihrten 
Mustern Xi (t,f) sind mit n die Intervalle auBer den 
Sprachintervallen (d h. keine Sprache enthaltende In- 
tervalle bzw, Nicht-Sprachen-Intervalle) bezeichnet. 
Die Gerausche- Vermutungseinheit 50 gibt das Mittel 65 
der zeitspektralen Muster Xin(t,f) als ein zweites zeit- 
spektrales Gerauschmuster N2(t,f) ab. Das zweite zeit- 
spektrale Gerauschmuster N2(t,f) entspricht inneren 



In dem vorstehenden Term Xis(t,f) ist mit s das Zeit- 
sprachintervall bezeichnet Die Sprachintervall- Fest- 
stelleinheit 40, die Gerausche- Vermutungseinheit 50 
und die zweite Gerausche-Subtrahiereinheit 60 arbeiten 
entsprechend der herkommlichen "spektralen Subtrak- 
tionsmethode**. 

Die Eingangsmuster erzeugende Einheit 70 wandelt 
die Merkmale oder Kennzeichen, welche durch die zeit- 
spektralen Muster S(t,f) festgesetzt worden sind, welche 
von der zweiten Gerausche-Subtrahiereinheit 60 gelie- 
fert worden sind, in ein eingegebenes Sprachmuster ent- 
sprechend einem bekannten BTSP-(Binary Time Spec- 
trum Pattem)Spracherkennungsverfahren um. Das 
BTSP-Spracherkennungsverfahren ist beispielsweise in 
Tuzzy Sets and Systems 32 (1989), Stn. 181 bis 191" 
beschrieben, Der Speicher 80 speichert die Referenz- 
musten Jedes der Referenzmuster hat ein Format, das 
auf dem BTSP-Spracherkennungsverfahren basiert. Die 
Erkennungseinheit 90 gibt das eingegebene Sprachmu- 
ster von der Eingabemuster erzeugenden Einheit 70 und 
die Referenzmuster von dem Referenzmusterspeicher 
80 ein und fuhrt eine Erkennungsoperation auf der Basis 
des BTSP-Spracherkennungsverfahrens durch. 

Die Sprachintervall-Detektionseinheit 40, die Ge- 
rausche- Vermutungseinheit 50, die zweite Gerausche- 
Subtrahiereinheit 60, die Eingabemuster erzeugende 
Einheit 70 und die Erkennungseinheit 90 sind beispiels- 
weise in einem Mikrocomputer ausgebildet. AuBerdem 
konnen die Methode, die Sprachintervalle in der 
Sprachintervall-Detektionseinheit 40 zu detektieren, die 
Methode, das Gerausch in der zweiten Gerausch-Sub- 
trahiereinheit 60 zu subtrahieren, das Verfahren, das 
eingegebene Sprachmuster in der Eingabemuster er- 
zeugenden Einheit 70, das Format des in dem Speicher 
80 gespeicherten Musters und eine Erkennungsopera- 
tion in der Erkennungseinheit 90 zu erzeugen, in solche 
Verfahren abgeandert werden, welche auf dem Gebiet 
der Spracherkennung bekannt sind Eine digitale Signal- 
funktionsschaltung, wie eine schnelle Fourier-Transfor- 
mation (FFT), kann an die Stelle von jeder der BandpaB- 
Filterbanke 13 und 23 gesetzt werden. Die ersten und 
zweiten Kennzeichen-Extrahiereinheiten 10 bzw. 20 ha- 
ben die A/D-Umsetzer 15 und 25; die ersten und zwei- 
ten Kennzeichen-Extrahiereinheiten konnen jedoch 
auch statt dessen einen A/D-Umsetzer durch eine Time- 
Sharing-Steuerung gemeinsam benutzen. 

Nunmehr wird eine Modifikation der ersten Ausfiih- 
rungsform anhand von Fig. 2 beschrieben. Fig. 2 zeigt 
das Spracherkennungssystem, um eine Sprache (Stim- 
me) eines Sprechers unter einer Voraussetzung zu er- 
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kennen, bei welcher zwei Lautsprecher in dem Fahr- 
zeug Klange abgeben. In Fig. 2 sind die Telle, weiche 
dieselben sind wie die in Fig. 1 dargestellten Telle mit 
denselben Bezugszelchen bezeichnet 

In Fig. 2 wird ein erstes wiederzugebendes Signal ei- 5 
nem ersten Lautsprecher 2a und ein zweites wiederzu- 
gebendes Signal einem zweiten Lautsprecher 2b zuge- 
fuhrt Das erste wiederzugebende Signal wird auch an 
eine zweite Kennzeichen-Extrahiereinheit 20a angelegt, 
und das zweite wiederzugebende Signal wird auch an 10 
eine andere, zweite Kennzeichen-Extrahiereinheit 20b 
angelegt. Das helBt, in diesem Spracherkennungssystem 
sind zwei zweite Kennzeichen-Extrahiereinheiten 20a 
und 20b vorgesehen. Eine zweite Kennzeichen-Extra- 
hiereinheit 20a hat eine Vorverzerrerschaltung 22a, eine 15 
BandpaB-Filterbank 23a, einen Multiplexer 24a und ei- 
nen A/D-Umsetzer 25a in derselben Weise wie in Fig. 1 
dargestellt ist. Die andere, zweite Kennzeichen-Extra- 
hiereinheit 20b hat eine Vorverzerrerschaltung 22b, ei- 
ne BandpaB-Filterbank 23b. einen Multiplexer 24b und 20 
einen A/D-Umsetzer 25b in derselben Weise, wie in 
Fig. 1 dargestellt ist. Ein Speicher 28a speichert eine 
erste Ubertragungsfunktion Ha(f) zwischen dem ersten 
Lautsprecher 2a und dem Mikrophon 1. Die erste Ober- 
tragungsfunktion Ha(f) zeigt einen Zustand an, bei wel- 25 
chem der von dem ersten Lautsprecher 2a abgegebene 
Klang sich zu dem Mikrophon 1 hin ausbreitet. Das 
heiBt, die erste Obertragungsfunktion Ha(f) gibt eine 
Beziehung zwischen einem von dem ersten Lautspre- 
cher 2a abgegebenen Klang und einem an dem Mikro- 30 
phon 1 ankommenden Klang wieder und andert sich 
aufgrund der Bedingungen in einem Raum, welcher den 
ersten Lautsprecher 2a und das Mikrophon 1 umgibt 
Die erste Obertragungsfunktion H(f) kann auch experi- 
mentell In derselben Weise wie in dem anhand von 35 
Fig. 1 beschriebenen Fall erhalten warden. Ein Speicher 
28b in der anderen zweiten Kennzeichen-Extrahierein- 
heit 20b speichert eine zweite Ubertragungsfunktion 
Hb(f) zwischen dem zweiten Lautsprecher 2b und dem 
Mikrophon 1. Die zweite Ubertragungsfunktion Hb(f) 40 
gibt einen Zustand wieder, unter welchem sich der von 
dem zweiten Lautsprecher 2b abgegebene Klang zu 
dem Mikrophon 1 hin ausbreitet bzw. fortpflanzt. Das 
helBt, die zweite Ubertragungsfunktion Hb(f) gibt eine 
Beziehung zwischen einem von dem zweiten Lautspre- 45 
cher 2a abgegebenen Klang und einem an dem Mikro- 
phon 1 ankommenden Klang wieder und andert sich 
aufgrund des Zustandes bzw. der Voraussetzungen in 
einem Raum, welcher den zweiten Lautsprecher 2b und 
das Mikrophon 1 umgibt. Die zweite Obertragungs- 50 
funktion Hb(0 kann auch auf dieselbe Weise wie in dem 
unter Bezugnahme auf Fig, 1 beschriebenen Fall experi- 
menteil erhalten werden. 

In der zweiten Kennzeichen-Extrahiereinheit 20a 
wird ein zeitspektrales Muster Na(t,f) des ersten wieder- 55 
zugebenden Signals erhalten, und dann multipliziert ei- 
ne Multipliziereinheit 27a das zeitspektrale Muster 
Na(t,f) und die erste Ubertragungsfunktion Ha(f), so dafi 
dann die Multipliziereinheit 27a abgibt: Na(t,f)x Ha( f). 
In der anderen, zweiten Kennzeichen-Extrahiereinheit so 
20b wird ein zeitspektrales Muster Nb(t,f) des zweiten 
wiederzugebenden Signals erhalten, und dann multipli- 
ziert eine Multipliziereinheit 27b die zeitspektralen Mu- 
ster Nb(t,f) und die zweite Ubertragungsfunktion Hb(f), 
so daB dann die MultipHziereinheit 27b abgibt: 65 
Nb(t,f) X Hb(f). Ein Addlerer 29 erhalt Na(t.f) x Ha(f) von 
der Multipliziereinheit 27a und Nb(t,f) x Hb(f) von der 
Multipliziereinheit 27b und gibt das folgende. zeitspek- 
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trale Gerauschmuster N](t.f) ab: 

Ni(t,f) = Na(t,f) X Ha(f) + Nb(t,f) X Hb(f). 



Der SpracherkennungsprozeB wird dann auf der Ba- 
sis des zeitspektralen Musters X(t,f), das von der ersten 
Kennzeichen-Extrahiereinheit 10 abgegeben worden 
ist, auf der Basis des zeitspektralen Gerauschmusters 
Ni(t,f), das von dem Addierer 29 abgegeben worden ist, 
und der Referenzmuster aus dem Speicher 80 In dersel- 
ben Weise wie bei dem vorstehend anhand von Fig. 1 
beschriebenen ProzeB durchgefiihrt. 

Das in Fig. 2 dargestellte Spracherkennungssystem 
wird in dem Fall angewendet, wenn zwei Lautsprecher 
2a und 2b im Inneren des Fahrzeugs vorgesehen sind. 
Selbst wenn die Anzahl von im Inneren des Fahrzeugs 
vorgesehener Lautsprecher groBer als zwei ist, kann 
jedoch das Spracherkennungssystem in derselben Wei- 
se wie in Fig. 2 dargestellt ist, durchgefuhrt werden. Das 
helBt, eine zweite Kennzeichen-Extrahiereinheit, eine 
Multipliziereinheit und einen Obertragungsfunktions- 
speicher, welcher jedem der Lautsprecher entspricht, 
sind vorgegeben und Ausgangsslgnale von den ver- 
schiedenen zweiten Kennzeichen-Extrahiereinheiten 
werden so addiert, daB das zeitspektrale Gerauschmu- 
ster Ni(t,f) erhalten wird. 

Nunmehr wird eine zweite Ausfuhrungsform der Er- 
findung anhand von Fig. 3 beschrieben. Die Ubertra- 
gungsfunktion H(f) zwischen dem Lautsprecher 2 und 
dem Mikrophon 1 andert sich aufgrund des Zustands 
bzw. der Voraussetzungen eines Raums, welcher den 
Lautsprecher 2 und das Mikrophon 1 umgibt. Menschli- 
che Korper absorbieren eine akustische Welle, so daB 
sich beispielsweise in dem Fahrzeug die Ubertragungs- 
funktion H(f) In Abhangigkeit von der Anzahl der Per- 
sonen im Inneren des Fahrzeugs andert Die Ubertra- 
gungsfunktion H(f) andert sich auch in Zusammenhang 
mit der Anzahl geoffneter TCiren und/oder Fenster in 
dem Fahrzeug, Daher werden in der zweiten Ausfuh- 
rungsform eine Anzahl Obertragungsfunktionen in dem 
Obertragungsfunktions-Speicher gespeichert, wobei je- 
de der Obertragungsfunktionen der Anzahl Personen 
Oder der Anzahl geoffneter Turen und/oder Fenster in 
dem Fahrzeug entspricht. 

In Fig. 3 sind die Telle, weiche dieselben wie diejeni- 
gen in Fig. 1 sind, mit denselben Bezugszeichen bezeich- 
net. In Fig. 3 werden eine Anzahl Obertragungsfunktio- 
nen Hr(t,f) vorher in dem Obertragungsfunktions-Spei- 
cher 28 gespeichert. In den Funktionen Hr<t,f) ist mit r 
ein bestimmter Typ der Obertragungsfunktionen H(t,f) 
bezeichnet. Beispielsweise wird dann, wenn die Anzahl 
Personen im Inneren des Fahrzeugs gleich r (r ^ 1,2, 
. . ,) ist, die Obertragungsfunktion mit Hr<f) bezeichnet. 
Jede der Obertragungsfunktionen Hr(f) wird experi- 
mentell unter der Voraussetzung erhalten, bei welcher r 
Personen in einem Fahrzeug sitzen. Beispielsweise wird 
jede der Obertragungsfunktionen Hr(f) auf der Basis des 
Impuls-Frequenzbereichs zwischen dem Lautsprecher 2 
und dem Mikrophon 1 unter der Voraussetzung erhal- 
ten, daB r Personen in dem Fahrzeug sitzen. 

Ein Wahlschalter 28' Ist zum Auswahlen einer der 
Obertragungsfunktionen Hj{f) vorgesehen. Der Wahl- 
schalter 28' hat eine Anzahl von Schaltelementen, wei- 
che jeweils der Anzahl Personen in dem Fahrzeug ent- 
sprechen. Wenn beispielsweise r Personen in dem Fahr- 
zeug sitzen, kann der Fahrer des Fahrzeugs ein Schal- 
terelement betatigen, das r Personen entspricht. Infolge 
der Betatigung des r Personen entsprechenden Schalt- 
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elements in dem Wahlschalter 28' wird die Ubertra- 
gungsfunktion Hr{f) aus dem Speicher 28 ausgelesen 
und der Multipliziereinheit 27 zugefuhrt. Die Multipli- 
ziereinheit 27 berechnet dann das folgende zeitspektra- 
le Gerauschmuster Ni(t,f). 5 

N,(t,f) = N(t,f) X Hr{f). 

Folglich wird dieses zeitspektrale Gerauschmuster 
Ni(t,f) von der zweiten Kennzeichen-Extrahiereinheit to 
20 abgegeben. 

Dann werden die Spracherkennungsprozesse auf der 
Basis des zeitspektralen Musters X(t,f), das von der er- 
sten Kennzeichen-Extrahiereinheit 10 abgegeben wor- 
den ist, auf der Basis des zeitspektralen GerSuschmu- 15 
sters Ni(t,f), das von der Kennzeichen-Extrahiereinheit 
20 abgegeben worden ist, und auf der Basis des von dem 
Speicher 80 abgegebenen Referenzmusters in derselben 
Weise wie die anhand von Fig. 1 beschriebenen Prozes- 
se durchgefuhrt 20 

Bei der zweiten Ausfuhrungsform kann die Obertra- 
gungsfunktion entsprechend der Anzahl Personen, wei- 
che in dem Fahrzeug sitzen, ausgewahit werden, so daB 
absolut sicher das Gerausch von dem Lautsprecher 2 
von dem Gerausch an dem Mikrophon 1 bzw. das von 25 
dem Mikrophon 1 aufgenommen worden ist, subtrahiert 
wird, selbst wenn sich die Anzahl Personen im Inneren 
des Fahrzeugs andert 

Nunmehr werden verschiedene Modifikationen der 
zweiten Ausfuhrungsform anhand von Fig. 4 bis 6 be- 30 
schrieben. In Fig. 4 ist ein Spracherkennungssystem 
dargestellt, bei welchem zwei Lautsprecher 2a und 2b 
im Inneren des Fahrzeugs vorgesehen sind. In Fig. 4 
sind die Teile, welche dieselben sind wie die in Fig. 2 und 
3 dargestellten Teile mit denselben Bezugszeichen be- 35 
zeichnet. In diesem Fall hat das Spracherkennungssy- 
stem zwei zweite Kennzeichen-Extrahiereinheiten 20a 
und 20b, welche den jeweiligen Lautsprechern 2a und 2b 
in derselben Weise wie diejenigen in Fig. 2 entsprechen. 
In jeder der zweiten Kennzeichen-Extrahiereinheiten 40 
20a und 20b werden eine Anzahl Obertragungsfunktio- 
nen Hr(f) in dem jeweiligen Obertragungsfunktions- 
Speicher 28a (28b) in derselben Weise wie in dem an- 
hand von Fig. 2 beschriebenen Spracherkennungssy- 
stem gespeichert. Dann wahlt der Wahlschalter 28' eine 45 
der in dem jeweiligen Speicher 28a (28b) gespeicherten 
Ubertragungsfunktionen in derselben Weise aus, wie in 
Fig. 3 dargestellt und anhand von Fig. 3 beschrieben ist. 

Die Ubertragungsfunktion andert sich in Abhangig- 
keit von einem Zustand, ob namlich jede der Turen 50 
und/oder Fenster des Fahrzeugs gedffnet oder ge- 
schlossen ist. In diesem Fall werden eine Anzahl Ober- 
tragungsfunktionen Hr(f) vorher in dem in Fig. 3 darge- 
stellten Speicher 28 oder in jedem der in Fig. 4 darge- 
stellten Speicher 28a und 28b gespeichert Beispielswei- 55 
se gibt es verschiedene Zustande, daB namlich jede der 
Turen des Fahrzeugs entweder gedffnet oder geschlos- 
sen ist Wenn das Fahrzeug V vier Turen Dl bis D4 hat, 
wie in Fig. 5 dargestellt ist, gibt es 16 (2^) Zustande, da 
jede der Turen Dl bis D4 entweder gedffnet oder ge- 60 
schlossen sein kann. Folglich entspricht jede der Uber- 
tragungsfunktionen Hr(f) dem r-ten Zustand der Turen 
(r = I, 2, ...16). Jede der Obertragungsfunktionen Hr(f) 
wird beispielweise auf der Basis des Impuls-Frequenz- 
verlaufs zwischen jedem Lautsprecher und dem Mikro- 65 
phon 1 in dem r-ten Zustand der Turen erhalten. 

In diesem Fall sind in dem Fahrzeug V, wie in Fig. 5 
dargestellt ist, vier Schalter SWl bis SW4 vorgesehen. 
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urn festzustellen ob verschiedene Turen Dl bis D4 ge- 
offnet sind oder nicht Jeder der Schalter SWl bis SW4 
wird automatisch angeschaltet, wenn eine der entspre- 
chenden Turen Dl bis D4 geschlossen ist Ein-/Aus-Si- 
gnale, welche von den Schaltern SWl bis SW4 abgege- 
ben werden, werden einer Steuereinheit 100 zugefuhrt 
Die Steuereinheit 100 hat Zugriff zu dem Speicher 28 
und wahlt eine Ubertragungsfunktion H (f) aus, welche 
dem r-ten Zustand der Turen entspricht, welcher durch 
die Ein-/ Aus-Signale spezifiziert ist, welche durch die 
Schalter SWl bis SW4 geliefert worden sind Die ausge- 
wahlte Ubertragungsfunktion H,<f) wird an die Multipli- 
ziereinheit 27 angelegt, welche dann das folgende zeit- 
spektrale Gerauschmuster Ni(t,f) in derselben Weise 
wie in Fig. 1 dargestellt ist, berechnet, namlich: 

N,(t,f) - X(t,f) X Hr<f). 



Es kann auch eine Ubertragungsfunktion zwischen 
dem Lautsprecher und dem Mikrophon entsprechend 
verschiedenen Zustanden bestimmt werden, je nachdem 
welches der Fenster des Fahrzeugs gedffnet oder ge- 
schlossen ist AuBerdem kann die Ubertragungsfunktion 
zwischen dem Lautsprecher und dem Mikrophon in 
Obereinstimmung damit bestimmt werden, wie viele der 
verschiedenen Fenster, die in dem Fahrzeug vorgesehen 
sind, geoffnet sind. In diesem Fall ist eine Fiihleinrich- 
tung, um festzustellen, wie viele der Fenster jeweils ge- 
offnet sind, in dem Spracherkennungssystem vorgese- 
hen, wie in Fig. 6 dargestellt ist 

In Fig. 6 hat eine Fuhleinheit 40 einen Schiebewider- 
stand R, welcher an einem Rahmen 41 jedes Fensters 
WD vorgesehen ist, eine Gleichstromversorgung Vo 
und ein Amperemeter 42. Das Fenster WD kann in dem 
Rahmen auf- und abwarts bewegt werden. Der Wert des 
Schiebewiderstands R wird entsprechend der GroBe 
der Kante des Fensters WD geandert,die mit dem Schie- 
bewiderstand R in Kontakt steht Die Gleichstromquel- 
le Vo, der Schiebewiderstand R und das Amperemeter 
42 sind in Reihe geschaltet, so daB der Wert des Schieb- 
widerstand R durch das Amperemeter 42 gemessen 
wird. Das heiBt, ein Ausgangssignal von dem Ampere- 
meter 42 gibt wieder, wie weit jedes Fenster WD gedff- 
net ist. Das Ausgangssignal von dem Amperemeter 42 
wird der Steuereinheit 100 zugefuhrt, welche wiederum 
die Ubertragungsfunktion auswahit, welche einem Aus- 
gangssignal entspricht, das von jeder Fuhleinheit 40 ge- 
liefert worden ist, die an jedem der Fenster des Fahr- 
zeugs vorgesehen ist 

Um zu verhindern, daB die Anzahl an Obertragungs- 
funktionen zunimmt, ist es wiinschenswert, daB, wie weit 
jedes Fenster WD geoffnet wird, in zwei oder drei Stu- 
fen eingeteilt wird Beispielsweise ist in der ersten Stufe 
jedes Fenster geschlossen oder befindet sich in einem 
Zustand zwischen dem geschlossenen Zustand und ei- 
nem Zustand, in welchem es zu einem Drittel geoffnet 
ist In der zweiten Stufe befindet sich jedes Fenster in 
dem Zustand, daB es zu einem Drittel geoffnet ist, oder 
weist einen Zustand zwischen dem Zustand, in welchem 
zu einem Drittel geoffnet ist, und einem Zustand, in 
welchem es zu zwei Drittel geoffnet ist In einer dritten 
Stufe nimmt jedes Fenster einen Zustand ein, in wel- 
chem es zu zwei Drittel geoffnet ist, oder es ist vollstsin- 
dig geoffnet oder nimmt einen Zustand zwischen dem 
Zustand, in welchem es zu zwei Drittel gedffnet ist, und 
dem voUstandig gedffneten Zustand ein. Wenn in die- 
sem Fall vier Fenster in dem Fahrzeug vorgesehen sind, 
haben die Fenster 81 (3^*) Zustande. Jede Ubertragungs- 
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funktion, welche jedem der 81 Zustande der Fenster 
entspricht, ist dann in dem Obertragungsfunktions-Spei- 
cher 28 vorgesehea 

Wieviel jedes Fenster geoffnet ist, kann auch mit Hilfe 
optischer Sensoren festgesteilt warden. AuBerdem kann 5 
die Ubertragungsfunktion auf der Basis einer Kombina- 
tion von zwei oder mehr der folgenden Faktoren be- 
stimmt werden: die Anzahl Fersonen im Inneren des 
Fahrzeugs, die Anordnung der Personen im Inneren des 
Fahrzeugs. ob jede Tur geoffnet oder geschlossen ist, 10 
und wie weit jedes Fenster geoffnet ist. 

GemaB der Erfindung kann das Gerausch von dem 
Lautsprecher von dem Klang, welcher dem Mikrophon 
zugefuiirt bzw. von diesem aufgenommen wird, mit Hil- 
fe der Obertragungskenndaten, wie der Obertragungs- 15 
funktion zwischen Lautsprecher und dem Mikrophon. 
subtrahiert werden. Somit kann ohne weiteres das Ge- 
rausch gegenuber dem akustischen Signal unterdruckt 
werden, 

20 

Patentanspruche 

1. Gerauschunterdruckungseinrichtung fur ein 
Spracherkennungssystem, in welchem eine Sprache 
eines Sprechers, welche einem Mikrophon (1) zuge- 25 
fuhrt worden ist, erkannt werden kann, wobei das 
Mikrophon in einem Raum zwischen einem Laut- 
sprecher (2), welcher einen Klang abgibt, der einem 
wiederzugebenden Signal entspricht, welches von 
einer Audio-Einheit zugefuhrt wird, und dem Laut- 30 
sprecher (2) vorgesehen ist, gekennzeichnet durch 
eine erste Kennzeichen-Extrahiereinheit (10), urn 
erste Kennzeichendaten aus einem akustischen Si- 
gnal zu extrahieren, das von dem Mikrophon (1) 
abgegeben worden ist, wobei die ersten Kennzei- 35 
chendaten ein Kennzeichen des akustischen Signals 
darstellen; 

eine zweite Kennzeichen-Extrahiereinheit (20), um 
zweite Kennzeichendaten aus dem wiederzugeben- 
den Signal zu extrahieren, welches dem Lautspre- 40 
cher (2) zugefuhrt werden sollte, wobei die zweiten 
Kennzeichendaten ein Kennzeichen des wiederzu- 
gebenden Signals darstellen; 
einen Speicher (28) zum Speichern von Obertra- 
gungskenndaten, welche einen Zustand darstellen, 45 
unter welchem sich ein Klang von dem Lautspre- 
cher (2) zu dem Mikrophon (1) ausbreitet, wobei die 
Ubertragungskenndaten vorher in dem Raum ge- 
messen worden sind, in welchem das Mikrophon (1) 
und der Lautsprecher (2) vorgesehen werden; 50 
eine erste Ger^uschkomponenten erzeugende Ein- 
heit (27), welche mit der zweiten Kennzeichen-Ex- 
trahiereinheit (20) und dem Speicher (28) verbun- 
den ist, um Gerauschdaten, welche auf den zweiten 
Kennzeichendaten von der zweiten Kennzeichen- 55 
Extrahiereinheit (20) und den Ubertragungskenn- 
daten von dem Speicher (28) beruhen, zu erzeugen, 
wobei die Gerauschdaten einen Klang darstellen, 
welcher sich von dem Lautsprecher (2) durch den 
Raum zu dem Mikrophon (1) fortpflanzt, und eo 
eine erste Gerausche-Subtrahiereinheit (30), wel- 
che mit der ersten Kennzeichen-Extrahiereinheit 
(10) und der ersten Gerauschkomponenten erzeu- 
genden Einheit (27) verbunden ist, um die Ge- 
rauschdaten, welche von der Gerauschkomponen- 65 
ten erzeugenden Einrichtung (27) zugefuhrt wor- 
den sind, von den ersten Kennzeichendaten zu sub- 
trahieren, die von der ersten Kennzeichen-Extra- 
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hiereinheit (10) zugefuhrt worden sind, und um er- 
ste Sprachdaten abzugeben, 
so daB die ersten Sprachdaten verwendet werden, 
um die Sprache/Stimme des Sprechers zu erken- 
nen, 

2. Einrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die Ubertragungskenndaten eine 
Ubertragungsfunktion zwischen dem Lautsprecher 
(2) und dem Mikrophon (1) sind, wobei die Ubertra- 
gungsfunktion eine Beziehung zwischen einem 
Klang, welcher von dem Lautsprecher (2) abgege- 
ben wird und einem Klang darstellt welcher von 
dem Lautsprecher (2) dem Mikrophon (1) zuge- 
fuhrt wird. 

3. Einrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB die erste Gerauschkomponenten er- 
zeugende Einheit eine Multipliziereinheit (27) auf- 
weist, welche die zweiten Kennzeichendaten und 
die Ubertragungsfunktion miteinander multipli- 
ziert, wobei das Multiplizierergebnis in der Multi- 
pliziereinheit (27) als die Gerauschdaten verwendet 
werden. 

4. Einrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, daB der Speicher (28) eine Anzahl Uber- 
tragungskenndaten speichert, welche jeweils einem 
Zustand des Raumes entsprechen, in welchem der 
Lautsprecher (2) und das Mikrophon (1) vorgese- 
hen sind, und daB die Rauschunterdruckungsein- 
richtung ferner eine Wahleinheit (28') aufweist, um 
eine der Obertragungskenndaten aus dem Speicher 
(28) entsprechend einem Zustand des Raums auszu- 
wahlen, in welchem der Lautsprecher (2) und das 
Mikrophon (1) vorhanden sind, so daB die ausge- 
wahlten Obertragungskenndaten der ersten Ge- 
rauschkomponenten erzeugenden Einheit (27) zu- 
gefuhrt werden. 

5. Einrichtung nach Anspruch 4, dadurch gekenn- 
zeichnet, daB das Mikrophon (1) im Inneren eines 
Fahrzeugs vorgesehen ist. in welchem der Laut- 
sprecher (2) vorgesehen ist, und daB jede der Ober- 
tragungskenndaten auf der Basis der Anzahl Perso- 
nen im Inneren des Fahrzeugs bestimmt wird, und 
daB die Wahleinheit (28') die Obertragungskennda- 
ten auswahlt, welche der Anzahl Personen im Inne- 
ren des Fahrzeugs entsprechen. 

6. Einrichtung nach Anspruch 4, dadurch gekenn- 
zeichnet, daB das Mikrophon (1) im Inneren eines 
Fahrzeugs vorgesehen ist, in welchem ein Laut- 
sprecher (2) vorgesehen ist, und daB Obertragungs- 
kenndaten jeweils in Abhangigkeit davon bestimmt 
werden, ob jede Tur des Fahrzeugs geoffnet oder 
geschlossen ist, und daB die Wahleinheit (28') dieje- 
nigen Obertragungskenndaten auswahlt, welche 
dem Zustand entsprechen, bei welchem die Turen 
des Fahrzeugs geoffnet oder geschlossen sind. 

7. Einrichtung nach Anspruch 6, dadurch gekenn- 
zeichnet, daB die Wahleinheit (28') Fiihleinheiten 
(SWl bis SW4; 100) aufweist. um festzustellen. ob 
jede Tur des Fahrzeugs geoffnet ist oder nicht, so 
daB die jeweilige Obertragungscharakteristik auf 
der Basis eines Fuhlergebnisses in der Fuhleinheit 
(SWl bis SW4; 100) gewShlt wird. 

8. Einrichtung nach Anspruch 4, dadurch gekenn- 
zeichnet, daB das Mikrophon (1) im Inneren eines 
Fahrzeugs vorgesehen ist, in welchem der Laut- 
sprecher (2) vorgesehen ist, und daB Obertragungs- 
kenndaten jeweils in Abhangigkeit davon bestimmt 
werden, wie weit jedes Fenster (WD) des Fahr- 
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zeugs geoffnet ist, und daB die Wahleinheit (28') die 
jeweiligen Obertragungskenndaten in Abhangig- 
keit davon auswahit, wie weit jedes Fenster des 
Fahrzeugs geoffnet ist. 

9. Einrichtung nach Anspruch 8, dadurch gekenn- 5 
zeichnet. daB die Wahleinheit (28') eine FUhleinheit 
(40) hat, um festzustellen, wie weit jedes Fenster 
des Fahrzeugs geoffnet ist, so daB eine Ubertra- 
gungscharakteristik in Abhangigkeit davon ge- 
wahlt wird, wie weit jedes Fenster geoffnet ist, was 10 
mittels der FUhleinheit (40) festgestellt worden ist. 

10. Einrichtung nach Anspruch 1, gekennzeichnet 
durch eine Gerauschkomponenten erzeugende 
Einheit (40, 50), welche mit der ersten Gerausche- 
Subtrahiereinheit (30) verbunden ist, um eine Ge- 15 
rauschkonnponente auf der Basis der ersten 
Sprachdaten zu erzeugen, und eine zweite Ge- 
rausche-Subtrahiereinheit (60), um die Gerausch- 
komponente, welche von der zweiten Gerausch- 
komponenten erzeugenden Einheit (40, 50) erzeugt 20 
worden ist, von den ersten Sprachdaten zu subtra- 
hieren, welche von der ersten Gerausche-Subtra- 
hiereinheit (30) zugefuhrt worden sind, wobei die 
zweite Gerausche-Subtrahiereinheit (60) zweite 
Sprachdaten abgibt. so daB die zweiten Sprachda- 25 
ten zum Erkennen der Sprache/Stimme des Spre- 
chers verwendet werden. 

11. Sprachunterdruckungseinrichtung fur ein 
Spracherkennungssystem, in welche eine Sprache/ 
Stimme eines Sprechers, welche einem Mikrophon 30 
(1) zugefuhrt worden ist, erkannt wird, wobei das 
Mikrophon (1) in einem Raum mit einer Anzahl 
Lautsprecher (2a, 2b) vorgesehen ist, wobei jeder 
der Lautsprecher (2a, 2b) einen Klang abgibt, wel- 
cher einem wiederzugebenden Signal entspricht, 35 
welches von einer Audio-Einheit jedem der Laut- 
sprecher (2a, 2b) zugefuhrt wird, gekennzeichnet 
durch 

eine erste Kennzeichen-Extrahiereinheit (10), um 
erste Kennzeichendaten aus einem akustischen Si- 40 
gnal zu extrahieren, das von dem Mikrophon (1) 
abgegeben worden ist, wobei die ersten Kennzei- 
chendaten einem Kennzeichen des akustischen Si- 
gnals entsprechen; 

eine zweite Kennzeichen-Extrahiereinheit (20a, 45 
20b), um zweite Kennzeichendaten von dem wie- 
derzugebenden Signal zu extrahieren, das jedem 
der Lautsprecher (2a, 2b) zugefuhrt werden sollte, 
wobei die zweiten Kennzeichendaten ein Kennzei- 
chen des wiederzugebenden Signals darstellen ; 50 
Speicher (28, 28b) zum Speichern von Obertra- 
gungskenndaten, welche einen Zustand darstellen, 
bei welchem ein Klang sich von jedem der Laut- 
sprecher (2a, 2b) zu dem Mikrophon (1) fortpflanzt, 
wobei die Obertragungskenndaten vorher in dem 55 
Raum gemessen worden sind, in welchem das Mi- 
krophon (1) und die Lautsprecher (2a, 2b) vorgese- 
hen werden; 

eine erste Gerauschkomponenten erzeugende Ein- 
richtung (27a, 27b), welche mit der zweiten Kenn- 60 
zeichen-Extrahiereinrichtung (20a, 20b) und den 
Speichern (28a, 28b) verbunden ist, um eine Ge- 
rauschkomponente auf der Basis der zweiten 
Kennzeichendaten von der zweiten Kennzeichen- 
Extrahiereinrichtung (20a, 20b) und die Obertra- 65 
gungskenndaten von den Speichern (28a, 28b) zu 
erzeugen, wobei die Gerauschkomponente einen 
Klang darstellt, welcher sich von jedem der Laut- 
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sprecher (2a, 2b) uber den Raum zu dem Mikro- 
phon (1) ausbreitet. 

eine Gerauschdaten erzeugende Einrichtung (29) 
zum Erzeugen von Gerauschdaten auf der Basis 
der jeweiligen Gerauschkomponente von der die 
erste Gerauschkomponente erzeugenden Einrich- 
tung (27a, 27b), und 

eine erste Gerausche-Subtrahiereinrichtung (30), 
welche mit der ersten Kennzeichen-Extrahierein- 
richtung (10) und der ersten Gerauschdaten erzeu- 
genden Einrichtung (29) verbunden ist, um die Ge- 
rauschdaten, welche von der Gerauschdaten erzeu- 
genden Einrichtung (29) zugefuhrt worden sind, 
von den ersten Kennzeichendaten zu subtrahieren, 
welche von der ersten Kennzeichen-Extrahierein- 
richtung (10) zugefuhrt worden sind, und um erste 
Sprachdaten abzugeben, 

so daB die ersten Sprachdaten zum Erkennen der 
Sprache/Stimme des Sprechers verwendet werden. 

12. Einrichtung nach Anspruch 1 1, dadurch gekenn- 
zeichnet, daB die Obertragungskenndaten eine 
Obertragungsfunktion zwischen jedem der Laut- 
sprecher (2a, 2b) und dem Mikrophon (1) sind, wo- 
bei die Obertragungsfunktion eine Beziehung zwi- 
schen einem Klang, welcher von jedem der Laut- 
sprecher (2a, 2b) abgegeben wird, und einem Klang 
darstellen, welcher von jedem der Lautsprecher 
(2a, 2b) dem Mikrophon (1) zugefuhrt wird. 

13. Einrichtung nach Anspruch 12, dadurch gekenn- 
zeichnet, daB die erste Gerauschkomponenten er- 
zeugende Einrichtung eine Multipliziereinrichtung 
(27a, 27b) aufweist, um die zweiten Kennzeichenda- 
ten und die Obertragungsfunktion miteinander zu 
multiplizieren, wobei ein Multiplizierergebnis in 
der Multipliziereinrichtung (27a, 27b) als die Ge- 
rauschkomponente verwendet wird 

14. Einrichtung nach Anspruch 13, dadurch gekenn- 
zeichnet, daB Gerauschdaten erzeugende Einrich- 
tung einen Addierer (29) aufweist, um Gerausch- 
komponenten, welche von der jeweiligen Multipli- 
ziereinrichtung (27a, 27b) zugefuhrt worden sind, 
zu addieren, wobei dann der Addierer (29) die Ge- 
rauschdaten abgibt. 

15. Einrichtung nach Anspruch 11, gekennzeichnet 
durch eine zweite Gerauschkomponenten erzeu- 
gende Einrichtung (40, 50), welche mit der ersten 
Gerausche-Subtrahiereinrichtung (30) verbunden 
ist, um eine Gerauschkomponente auf der Basis der 
ersten Sprachdaten zu erzeugen, und eine zweite 
Gerausche-Subtrahiereinrichtung (60) zum Subtra- 
hieren der Gerauschkomponente, welche von der 
zweiten Gerauschkomponenten erzeugenden Ein- 
richtung (40, 50) erzeugt worden ist, von den ersten 
Sprachdaten zu subtrahieren, welche von der er- 
sten Gerausche-Subtrahiereinrichtung (30) zuge- 
fuhrt worden sind, wobei die zweite Gerausche- 
Subtrahiereinrichtung (60) zweite Sprachdaten ab- 
gibt, so daB die zweiten Sprachdaten zum Erken- 
nen der Sprache/Stimme des Sprechers verwendet 
werden. 
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